Llama 4 family of models from Meta are now available in SageMaker JumpStart
今天,我们很高兴地宣布亚马逊萨吉式制造商Jumpstart的Llama 4 Scout和MaverickModels的可用性。在这篇博客文章中,我们将带您了解如何使用SageMaker Jumpstart进行部署和提示Allama-4-Scout-17b-16e-Inscruct模型。
Multi-tenancy in RAG applications in a single Amazon Bedrock knowledge base with metadata filtering
这篇文章演示了亚马逊基石知识库如何帮助您有效地扩展数据管理,同时维护不同管理级别的适当访问控制。
Effectively use prompt caching on Amazon Bedrock
提示缓存,现在通常在亚马逊基岩上提供,拟人化的Claude 3.5 Haiku和Claude 3.7十四行诗,以及Nova Micro,Nova Lite和Nova Pro模型,可将响应延迟降低高达85%,并通过在多个API调用中降低90%的响应延迟,并降低90%的费用高达90%。这篇文章详细概述了亚马逊基岩上的及时缓存功能,并提供了有关如何有效使用此功能以提高延迟和成本节省的指导。
在这篇文章中,我向您展示了如何结合Langchain的Langgraph,Amazon Sagemaker AI和MLFlow,以演示用于开发,评估和部署复杂的Generativeai代理的强大工作流程。该集成提供了所需的工具,可以深入了解Generativeai代理的性能,快速迭代并在整个开发过程中维护版本控制。
Evaluate models or RAG systems using Amazon Bedrock Evaluations – Now generally available
今天,我们很高兴地宣布亚马逊基岩评估中这些评估功能的总体可用性,以及使它们完全不合时宜的重大增强功能。在这篇文章中,我们详细探讨了这些新功能,向您展示了如何通过实例来评估抹布系统和模型。我们演示了如何利用比较功能对不同的实现进行基准测试,并就您的AI部署做出数据驱动的决策。
Fine-tune large language models with reinforcement learning from human or AI feedback
在这篇文章中,我们引入了一种最先进的方法来通过增强学习来微调LLM,审查了RLHF与RLAIF与DPO的利弊,并看到了如何与RLAIF进行LLM微调工作。我们还看到了如何使用拥抱面式变压器和TRL库对萨吉式制造商实施端到端的RLAIF管道,以及使用现成的毒性奖励模型在PPO期间与对齐响应,或直接提示LLM在PPO期间产生定量奖励反馈。
How Lumi streamlines loan approvals with Amazon SageMaker AI
Lumi是澳大利亚领先的金融科技贷方,以快速,灵活和透明的资金解决方案赋予小型企业能力。他们使用实时数据和机器学习(ML)提供定制的贷款,以促进可持续增长并解决获得资本的挑战。这篇文章探讨了Lumi如何使用Amazon Sagemaker AI来实现此目标,增强其交易处理和分类功能,并最终通过提供更快的贷款申请,更准确的信贷决策以及改善客户体验来发展其业务。
How AWS Sales uses generative AI to streamline account planning
每年,AWS销售人员在深入的,前瞻性的策略文件中为已建立的AWS客户提供。这些文件可帮助AWS销售团队与我们的客户增长策略保持一致,并与整个销售团队合作就AWS客户的长期增长想法。在这篇文章中,我们展示了AWS销售产品团队如何建立生成AI帐户计划草案助手。
Shaping the future: OMRON’s data-driven journey with AWS
Omron Corporation是工业自动化,医疗保健和电子组件领域的领先技术提供商。在塑造未来2030年(SF2030)战略计划的过程中,Omron旨在解决各种社会问题,推动可持续的业务增长,改变业务模式和能力,并加速数字化转型。这种转型的核心是Omron Data&Analytics平台(ODAP),这是一项旨在彻底改变公司如何利用其数据资产的创新计划。这篇文章探讨了Omron Europe如何使用Amazon Web Services(AWS)来构建其先进的ODAP及其在利用生成AI的力量方面的进步。
AI Workforce: using AI and Drones to simplify infrastructure inspections
检查风力涡轮机,电源线,5G塔和管道是一项艰巨的工作。这通常很危险,耗时,容易出现人为错误。这篇文章是探索AI劳动力的三部分系列中的第一篇文章,即AWS AI驱动的无人机检查系统。在这篇文章中,我们介绍了概念和关键好处。第二篇文章深入介绍了为AI劳动力提供动力的AWS体系结构,第三篇重点是无人机设置和集成。
Ray jobs on Amazon SageMaker HyperPod: scalable and resilient distributed AI
Ray是一个开源框架,使创建,部署和优化分布式Python作业变得直接。在这篇文章中,我们演示了在Sagemaker Hyperpod上运行射线作业的步骤。
Using Large Language Models on Amazon Bedrock for multi-step task execution
本文探讨了LLM在通过API执行复杂分析查询中的应用,并特别关注亚马逊基岩。为了证明这一过程,我们提出了一个用例,该系统通过检索,分组和分类数据来识别患者的疫苗数量最少,并最终呈现最终结果。
Introducing AWS MCP Servers for code assistants (Part 1)
我们很高兴地宣布代码助理的AWS MCP服务器的开源发布 - 一套专门的模型上下文协议(MCP)服务器,将Amazon Web Services(AWS)最佳实践直接带入您的开发工作流程。这篇文章是涵盖AWS MCP服务器的系列中的第一篇。在这篇文章中,我们介绍了这些专业的MCP服务器如何大大减少您的开发时间,同时将安全控制,成本优化以及AWS良好的最佳实践纳入您的代码中。
Harness the power of MCP servers with Amazon Bedrock Agents
今天,MCP正在为代理提供标准访问,以访问扩展的可访问工具列表,您可以使用这些列表来完成各种任务。在这篇文章中,我们向您展示了如何构建一个使用MCP访问数据源以快速构建生成AI应用程序的亚马逊基石代理。
Generate compliant content with Amazon Bedrock and ConstitutionalChain
在这篇文章中,我们探讨了使用宪法AI的实用策略,以有效而有效地使用Amazon Bedrock和Langgraph生产合规性内容,以在金融和医疗保健等高度受监管的行业中建立宪法链接
Minimize generative AI hallucinations with Amazon Bedrock Automated Reasoning checks
为了提高大语模型(LLM)响应的事实准确性,AWS宣布Amazon Bedrock自动推理检查(在Gated Preview)上,网址为AWS RE:Invent 2024。在这篇文章中,我们讨论了如何帮助防止使用Amazon Bedrock自动化的推理检查来防止生成的AI幻觉。
AWS App Studio introduces a prebuilt solutions catalog and cross-instance Import and Export
在最近的AWS新帖子中,App Studio宣布了两个新功能,以加速应用程序建筑:预先构建的解决方案目录和跨境进口和出口。在这篇文章中,我们将浏览如何使用预制的解决方案目录快速启动并使用进口和导出功能